شهرآرانیوز؛ محققان دانشگاه کارنگی ملون در یک تحقیق آزمایشی، یک شرکت نرمافزاری ساختگی را کاملاً با عوامل هوش مصنوعی ایجاد کردند که نتایج آن به ناامیدکننده بوده است. مدلهای هوش مصنوعی این تحقیق اساساً برای انجام تنهایی وظایف طراحی شده بودند.
این شبیهسازی که TheAgentCompany نام دارد، کاملاً با کارمندان هوش مصنوعی گوگل، OpenAI، آنتروپیک و متا اداره میشد. آنها بهعنوان تحلیلگر مالی، مهندس نرمافزار و مدیران پروژه مشغول به کار شدند و در کنار همکاران شبیهسازیشده دیگرشان در بخش منابع انسانی و مدیر ارشد فنی کار میکردند.
برای دیدن اینکه مدلها در محیطهای دنیای واقعی چگونه عمل میکنند، محققان وظایف را براساس کار روزانه یک شرکت نرمافزاری واقعی تعیین کردند. کارکنان هوشمند این اداره به کارهایی مثل پیمایش دایرکتوریهای فایل، گشت و گذار مجازی در فضاهای اداری جدید و نوشتن بررسی عملکرد برای مهندسان نرمافزار مشغول بودند.
همانطور که Business Insider گزارش داده، نتایج ناامیدکننده بوده است. بهترین مدل Claude ۳.۵ Sonnet از شرکت Anthropic بود که تنها ۲۴ درصد از کارهای محولشده را به اتمام رساند. نویسندگان این مطالعه خاطرنشان میکنند که حتی این عملکرد ناچیز نیز بسیار گران تمام میشود: به طور متوسط شامل تقریباً ۳۰ مرحله و با هزینه بیش از ۶ دلار برای هر کار.
دومین رتبه در بین همه مدلها Gemini ۲.۰ Flash گوگل بود که به طور متوسط ۴۰ مرحله زمانبر را برای هر کار به پایان رساند، اما تنها ۱۱.۴ درصد موفقیت داشت.
بدترین کارمند هوش مصنوعی، Nova Pro v۱ آمازون بود که تنها ۱.۷ درصد از تکالیف خود را با میانگین تقریباً ۲۰ مرحله به پایان رساند.
محققان در نتایج این تحقیق نوشتهاند که کارکنان فاقد عقل سلیم، مهارتهای اجتماعی کافی و درک قوی از نحوه پیمایش در اینترنت هستند.
رباتها همچنین دچار خودفریبی مزمن بودند. آنها میانبرهایی ایجاد میکردند که خودشان را به سمت انجام کامل کار سوق میداد. «برای مثال، در حین اجرای یک وظیفه، عامل هوش مصنوعی نمیتواند فرد مناسب برای پرسیدن سؤال در [چت شرکت] را پیدا کند. در نتیجه، تصمیم میگیرد با تغییر نام کاربر دیگری به نام کاربر موردنظر، یک راه حل میانبر ایجاد کند!»
در حالی که طبق گزارشها، عاملهای هوش مصنوعی میتوانند برخی از وظایف کوچکتر را به خوبی انجام دهند، نتایج این مطالعه و سایر مطالعات نشان میدهد که آنها به وضوح برای کارهای پیچیدهتری که انسانها در آنها برتری دارند، آماده نیستند. دلیل اصلی این امر این است که «هوش مصنوعی» فعلی ما، مسلماً هنوز فقط یک بسط پیچیده از متن پیشبینیکننده تلفن شماست، نه یک عامل هوشمند که بتواند مشکلات را حل کند، از تجربیات گذشته درس بگیرد و آن تجربیات را در موقعیتهای جدید به کار گیرد.
نتیجه: ماشینها، برخلاف آنچه شرکتهای بزرگ فناوری ادعا میکنند، به این زودیها نمیتوانند شغل شما را بگیرند.